R Installation locale

Nous allons localement installer R et l’éditeur Rstudio, afin de poursuivre le cours FIN 403 depuis chez vous.

  1. naviguer sur le slide du premier cours vous trouverez un tuto
  2. Installer R grâce au site suivant https://cloud.r-project.org/
  3. Puis, Installer Rstudio l’éditeur de R grâce au site suivant https://rstudio.com/products/rstudio/download/#download
  4. Tester votre installation en allant dans la console de RStudio pour rappel le slide présentant
  5. Puis, Installer la package ggplot2.
  6. Charger la library ggplot2 et créer deux vecteurs a et b pour rappel qui permettent de dessiner le graphe ci-dessous.
  7. Faire un Nuage de points à l’aide du package ggplot2, ou de la fonction de base afin de retrouver les graphes ci-dessus.
  8. Refaire le même graphe à l’aide du data frame au lieu de deux vecteurs.

Column

TD installation de l’environement R function qplot

Column

TD installation de R function plot

R Markdown Introduction

Table

     speed           dist       
 Min.   : 4.0   Min.   :  2.00  
 1st Qu.:12.0   1st Qu.: 26.00  
 Median :15.0   Median : 36.00  
 Mean   :15.4   Mean   : 42.98  
 3rd Qu.:19.0   3rd Qu.: 56.00  
 Max.   :25.0   Max.   :120.00  

Cette page est un document “R Markdown”. Markdown est un simple langage de syntaxe qui permet la génération de code sous format HTML, PDF, et MS Word documents.

Ce n’est pas un outil d’édition comme word «What you see is what you get» WYSIWYG via une interface graphique. A l’opposé Markdown est un code qui peut être catégorisé comme un outil WYSIWYM «What you see is what you mean».

Il faut en quelque sorte le compiler afin de voir le résultats de votre création à l’instar de Word Microsoft. L’avantage de R markdown réside dans la possibilité d’ajouter facilement du code R à l’intérieur de votre document et l’automatisation de rapport grâce au notion de fonction et d boucel que nous avons a vu à la fin du cours dernier.

Pour plus de détail, n’hésitez pas à visiter le site suivant afin de découvrir ce package R http://rmarkdown.rstudio.com.

Quand vous cliquez sur le bouton Knit bouton un document va être créé et vous pouvez facilement ajouté du code R dedans comme ci-dessous à l’aide du boutton Insert :

Plot


Vous pouvez faire la même chose avec un graphe

html widget


Vous pouvez faire la même chose avec un graphe interactif grâce au package DT pour plus d’information https://rstudio.github.io/DT/

Des images

![impressionant](https://media.giphy.com/media/w9xG5hsxZlqtevPlJQ/giphy.gif)

impressionant

impressionant

Des listes

Nous allons parler durant ce cours de :

* Installation de R 
* Rmarkdown 
* data mining de données de pollution 

Nous allons parler durant ce cours de :

  • l’installation de R et Rstudio
  • Rmarkdown
  • data mining de données de pollution
  • et un peu de data visualisation

Des Videos

<iframe width="560" height="315" src="https://www.youtube.com/embed/rlR4PJn8b8I" frameborder="0" allowfullscreen></iframe>


Data Mining & Visualisation

Fin du dernier cours

  1. Coder une fonction factorielle grâce à une boucle for.
  2. Utiliser votre fonction pour calculer les factorielles entre \(x \, \epsilon \, [0,30]\)
  3. Vérifier le résultat de votre fonction à l’aide d’un graphe \(x \, \epsilon \, [0,30]\) et \(y = x!\). Pour ce faire, utiliser deux vecteurs x et y, ainsi que votre fonction.
  4. Importer les données de la ville d’angers
  5. Tracer cette série temporelle en fonction des dates.

New TD

On va découvrir comment traiter des données de séries temporelles de pollution et de météo à Shanghai. Pour ce faire, nous allons explorer le fichier csv pollution_shanghai.csv.

Etape de Data Mining

  1. Créer un document Rmarkdown avec votre nom et prénom. Ajouter les lignes de commandes que vous allez lancer dans ce TD.
  2. Importer les données. Pour cela, vous pouvez utiliser les fonctions read.table(), read.csv() et readr::read_csv() ou l’interface graphique pour rappel.
  3. Quel est le type/class de l’objet que vous avez téléchargé et importé ?
  4. Même chose pour les éléments colonnes de cet objet ? Pensez à utiliser une boucle for.
  5. Explorer vos données à l’aide des fonctions head, tail,View et Summary ?
  6. Tracer des graphes de ces séries temporelles.

Column

TD fonction factorielle

Pollution No2

Column

TD fonction factorielle

Pollution PM2.5